Fouille d'opinion : ces mots qui changent de polarité selon le domaine
نویسنده
چکیده
Sentiment is expressed differently in different domains. For instance, words which are used in both domains can change their polarity. In this article, we present a study on these multi-polarity words. We first show that these multi-polarity words are actually used by automatic opinion classifiers and affect their performances: the classification performance improves if the multi-polarity words are considered as two different words, or even suppressed from the representation. In a second part, we present an exploratory method for multi-polarity words detection without any labelled target data. This method relies on the comparison of the co-occurrence profiles of the words with a set of pivot words, selected to have only one polarity. MOTS-CLÉS : Fouille d’opinion, Adaptation au domaine, Changement de polarité
منابع مشابه
Study of Domain Dependant Multi-Polarity Words for Document Level Opinion Mining (Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d'opinion au niveau du texte) [in French]
Résumé. Les méthodes de détection automatique de l’opinion dans des textes s’appuient sur l’association d’une polarité d’opinion aux mots des textes, par lexique ou par apprentissage. Or, certains mots ont des polarités qui peuvent varier selon le domaine thématique du texte. Nous proposons dans cet article une étude des mots ou groupes de mots marqueurs d’opinion au niveau du texte et qui ont ...
متن کاملConstruction automatique de ressources lexicales pour la fouille d'opinion
RÉSUMÉ. De nombreuses méthodes automatiques de fouille d'opinion s'appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la pol...
متن کاملMéta-apprentissage d'expériences Concepts, stratégies et perspectives
Résumé. Dans certains domaines de la vie économique, notamment dans le domaine de la santé, de nombreuses expériences réparties dans le temps et/ou dans l’espace traitent d’un même sujet et y apportent leur éclairage. De chaque expérience, on peut élaborer une prédiction, une connaissance selon différentes techniques d’apprentissage. La problématique de notre article vise à répondre à la questi...
متن کاملFouille de données datées hétérogènes optimisant les opérations et la maintenance de véhicules
L’exploitation et la mise à profit des données récupérées à partir de capteurs sont un sujet clef dans beaucoup de domaines d’application. La complexité réside autant dans le volume des flux d’information récupérés, que dans l’interprétation des données. Spécialement, dans le domaine de l’aéronautique, cette tâche est plus ardue vu la quantité des flux récupérés, la nature des données, la compl...
متن کاملLa génération des résumés visuels de flux de données de capteurs météorologiques avec des chorèmes
La géovisualisation est considérée comme un domaine de recherche en pleine expansion, elle utilise des outils intelligents qui peuvent aider à trouver "une aiguille dans une botte de foin", en s’appuyant sur des techniques pour filtrer les données pertinentes (Kraak, 2003). En outre, en ce qui concerne les données en temps réel provenant de capteurs, la complexité augmente davantage. Plusieurs ...
متن کامل